decode

云上AI推理平台全掌握(6):大规模EP专家并行

近年来,混合专家模型(Mixture of Experts,MoE)在大型语言模型领域展现出巨大潜力。MoE 架构是一种高效扩展模型规模的新技术,利用了“分而治之”的思想,设计了一系列不同的子网络(称为“专家”),通过门控网络来动态决定当前的输入应该交由哪几个

推理 moe ep eas decode 2025-09-27 12:12  2

OK!封面|张予曦 毕雯珺 爱人也爱己

这部由张予曦、毕雯珺领衔主演的都市爱情剧,改编自晋江文学城耳东兔子的同名小说,讲述了30岁职场女性叶濛辞职返乡后,与神秘冷峻的李靳屿,从相遇、相知到相爱的治愈故事。凭借“红裙单手抱”“直球表白”“红温片段”等高能名场面,该剧轻轻松松火上热搜并持续霸榜,被观众誉

张予曦 prada 密语 爱己 decode 2025-08-08 20:43  6

国产AI芯片三年,一些思考

刚好最近有时间,聊聊这三年在国产芯片上的工作经历。一方面是记录一下这三年做的一些事,一方面是基于这三年的工作经验引发的一些思考。我是在22年年中的时候离开一家大公司去了一家小公司,主要是做高性能计算,针对各种硬件做性能优化。这三年陆陆续续地接触了几款国产芯片,

芯片 cuda decode blas simd 2025-08-07 15:21  8

开放创新托举产业生态,昇腾AI持续升腾

当前,智能算力革命重塑产业创新范式,人工智能进入“指数级跃迁”时代,模型迭代速度也迎来“指数级加速”。无论是扩展模型规模、提升泛化能力的“参数摸高”,还是优化模型架构、提升运行效率的“工程创新”,都在沿着各自路径快速推进,共同推动大模型敏捷迭代和规模应用。

创新 生态 moe 托举 decode 2025-05-29 19:37  10

一起昇腾,共绽光芒

2025年5月23日,在鲲鹏昇腾开发者大会2025期间,昇腾AI开发者峰会在北京正式召开。会上,华为昇腾计算业务总裁张迪煊发表了《一起昇腾,共绽光芒》的演讲。他表示,昇腾打造了业界最大规模的昇腾384超节点,同时发布CATLASS算子模板库、MindIE Mo

推理 开源 moe npu decode 2025-05-24 18:05  14

如何重现 DeepSeek 推理性能突破

DeepSeek-V3 在多个评测中展现出强大性能,成为当前最受关注的开源大模型之一。由于采用了大规模 MoE 架构,如何优化推理性能,是工程落地上的关键难点。DeepSeek 团队于 2 月相继开源了 DeepEP、DeepGEMM、FlashMLA、EPL

推理 deepseek decode deepseek推理 2025-05-19 15:55  13

我有很多漂亮👟

休闲鞋已经是鞋柜里最常搭配到的单品了 夏天又会安置很多丰富的颜色 今年尤其爱穿基础风 想要出门有一种毫不费力的时髦感 三套穿搭公式可以直接抄作业啦~ 👟公式1:adidas STADT T头鞋 蓝白条纹小吊带+橄榄绿的牛仔半裙+紫色小短袜+带有金属感的小包

adidas 抄作业 涂鸦 短袜 decode 2025-05-17 03:01  13